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摘 要 : 隐私 泄露 问题 已 经 成 为 阻碍 基于 位 置 的 服务 (location-based services，LBS) 进 一 步 发 展 的 原因 。 针 对 当 LBS 
用 户 发 送 查 询 时 ， 用 户 的 个 人 隐私 可 能 会 泄露 给 攻击 者 的 问题 ， 提 出 了 基于 遗传 算法 的 空间 网 格 划 分 的 隐私 保护 算 
法 (简称 GAGP) 。 算 法 包括 两 个 方法 ， 地 图 分 割 算法 和 假名 生成 法 。 地 图 分 割 算法 利用 遗传 算法 给 每 个 网 格 赋 权 
值 ， 再 通过 使 用 邻接 网 格 扩展 的 方法 ， 保 证 每 个 划分 区 域 的 查询 频率 基本 相等 。 假 名 生成 法 是 用 户 在 每 次 发 送 查 询 
时 使 用 假名 来 应 对 长 期 统计 的 攻击 方式 。 通 过 实验 证 明 所 提 算 法 与 其 他 三 种 算法 相 比 结果 较 好 ， 所 以 提出 的 方案 能 
够 有 效 的 保护 用 户 的 隐私 。 
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Anonymous algorithm for spatial mesh generation based on genetic algorithm 


Sun Yue?, Zhang Lei**, Li Jing*, Zhang Zhen? 
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Heilongjiang 154007, China) 


Abstract: Privacy breaches have become an obstacle to the further development of location-based services (location-based 
services, LBS) . Concerns that when a LBS user sends a query, the user's personal privacy may be disclosed to an attacker. 
This paper proposed a scheme called grid-based genetic privacy protection algorithm (short for GAGP) that based on the 
conception of weighted optimal genetic algorithm. This scheme involved two basic procedures: map segmentation and 
pseudonym generation. Map segmentation algorithm uses genetic algorithm to assign values to each grid, and then uses the 
method of adjacent grid expansion to ensure that the query frequency of each partition area is basically equal. Kana 
generation is a way for users to use a pseudonym each time they send a query in response to a long-term statistical attack. 
The experimental results show that the proposed algorithm is better than the other three algorithms, so the proposed scheme 
can effectively protect the privacy of users. 
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0 az 询 数据 计算 出 每 个 网 格 提交 查询 的 概率 ， 使 用 基于 遗传 算法 
a a 的 方法 算出 权 值 。 然 后 根据 水 平 扩展 方法 来 扩张 网 格 区 域 ， 
pum 当今 社会 网 络 定位 技术 不 断 发 展 ， 位 置 服务 ( location 保证 每 个 查询 区 域 的 权 值 基本 相同 即 每 个 匿名 区 域 的 查询 频 
based service, LBS) 已 经 是 人 们 生活 中 不 可 或 缺 的 服务 0 。 率 基 本 相同 , 最 后 采用 多 假名 的 方法 防止 LBS 服务 器 的 长 期 
随 着 LBS 给 用 户 提 供 服务 的 , 同时 也 给 人 们 带 来 了 位 置 隐私 统计 攻击 。 实验 中 使 用 真实 数据 对 GAGP 算法 进行 实验 仿真 
泄露 的 重要 问题 ， 因 此 能 否 解决 用 户 隐 私 保 护 的 需要 也 就 成 与 分 析 ， 并 与 其 他 三 种 算法 进行 对 比 ， 最 终 实验 结果 验证 

为 了 公众 安心 使 用 LBS 服务 的 重要 前 提 B-5。 随 着 技术 的 逐 GAGP 算法 的 良好 性 能 。 
步 发 展 ， 出 现 了 多 种 对 位 置 数 据 隐私 保护 的 方法 [m9。 例 如， 


BE”, EE EZ., ZSR "2 等 方法 ， 其 中 1 ”准备 工作 

使 用 最 为 广泛 的 是 大 匿名 方法 03-!909。 其 中 最 开始 使 用 的 11 LBS 服务 

Random 不 考虑 查询 概率 ， 通 过 随机 选择 生成 匿名 区 域 的 算 在 现 有 的 LBS 查询 方法 中 ， 用 户 向 LBS 服务 器 提交 查 
法 :以 及 后 来 的 GridDummyt1"1 是 和 在 满足 用 户 隐 私 要 求 的 情 询 前 ， 移 动用 户 首先 通过 内 置 于 智能 手机 的 GPS/WIFI 模块 
况 下 获取 匿名 区 域 的 方法 ; 再 到 en-DLSUS) 算法 是 基于 从 用 来 获取 自己 的 当前 位 置 。 然 后 智能 手机 直接 或 者 通过 第 三 方 
户 的 历史 位 置 提 出 的 虚拟 位 置 选择 的 算法 。 但 都 仅 通过 用 户 服务 器 将 查询 内 容 发 送 到 LBS 服务 器 , 包括 标志 符 ， 确 切 位 
的 位 置信 息 来 保护 用 户 位 置 隐私 ， 不 能 应 对 针对 长 期 统计 的 A, 兴趣 和 查询 范围 等 。 最 后 LBS 服务 器 将 根据 用 户 的 查询 


攻击 方法 以 达到 隐私 保护 的 目的 。 反馈 POI， 如 图 1 所 示 。 
为 了 解决 上 述 讨论 的 问题 ， 本 文 提出 GAGP SEXE. 首先 为 了 使 用 户 的 隐私 信息 不 受到 侵害 ， 在 传统 的 隐私 保护 


用 户 可 以 进行 网 格 的 预 划分 ， 代 理 可 以 根据 所 获得 的 历史 查 。 算法 的 方法 中 ， 选 择 d 个 用 户 建立 协作 组 来 混淆 攻击 者 来 
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题 ， 然 而 大 多 数 现 有 作品 一 般 使 / 


发 送 查 询 , 在 
会 认为 


秆 机 方案 中 , 虚拟 位 


随机 的 方法 来 选 
置 。 如 下 例 所 示 ， 这 并 不 是 一 个 最 好 的 解决 方法 。 
是 随机 选择 
1 被 攻击 者 发 现 的 概率 是 ， 这 也 是 k- 匿 名 的 理 
果 ， 但 由 于 攻击 者 会 根据 位 置 查询 概率 的 辅助 信息 过 滤 掉 一 
些 过 分 虚假 的 位 置 ， 使 得 隐私 级 别 降低 ， 如 图 2 所 示 
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图 1 LBS 的 系统 结构 


Fig. 1 The system structure of LBS 


图 2 通过 分 析 虚 假 位 置 进行 攻击 的 方法 


Fig.2 Method of attack by analyzing false position 
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信息 ， 并 且 对 用 户 的 
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攻击 者 可 以 监视 某 个 区 域 ， 


攻击 者 也 可 以 以 病毒 的 形式 侵 
入 到 LBS 服务 器 ， 查 看 LBS 服务 器 发 送 给 | 


J HJ POL M 


息 。 攻 击 者 还 可 以 直接 在 侵入 
的 LBS 服务 器 中 获取 到 历史 数据 ， 
出 于 利益 ， 他 试图 获取 与 用 户 相 关 的 隐私 
以 及 LBS 查询 感 兴趣 。 他 能 够 


因此 在 本 文中 ， 以 LBS 


获取 系统 中 的 所 有 信息 , 不 仅 知道 用 户 当 前 的 LBS 查询 ,还 


可 以 获取 用 户 的 历史 数据 。 
1.2 研究 动机 和 基本 思想 


实 位 
利用 


用 户 确 定好 初始 的 网 格 划 分 程 


用 邻接 网 格 扩展 匿名 算法 进行 


于 攻击 者 可 掌握 某 一 指定 
查询 频率 ) ， 并 利用 这 些 知 识 作为 辅 
。 针 对 这 样 一 种 潜在 的 攻击 行为 ， 本 文 的 基础 思想 是 
万 化 的 网 格 划分 来 应 对 长 期 统计 攻击 和 区 域 攻击 。 基 于 
这 样 一 种 思想 提出 了 GAGP 的 隐私 保护 方法 。 该 方法 首先 
度 ， 并 通过 遗传 算法 获取 到 每 
个 单元 格 的 权 值 ， 将 这 些 权 值 求 和 取 平 均 得 到 闵 值 ， 其 次 使 
网 格 的 扩展 ， 即 从 第 一 个 网 格 
开始 ， 与 水 平 临 接 网 格 的 权 值 进行 相 加 ， 并 判断 当前 权 值 之 
和 是 否 等 于 平均 权 值 ， 若 相等 则 返回 该 网 格 区 域 。 若 不 相等 
则 根据 权 值 之 和 与 平均 权 值 的 差 是 否 满足 相应 条 件 来 选择 是 


户 的 背景 知识 (如 用 
助 信息 来 识别 用 户 的 真 
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和 否 继续 扩展 ， 该 方法 以 递归 的 形式 对 未 进入 匿名 区 域 的 单元 


格 执行 上 一 步 算法 直至 所 有 的 单元 网 格 遍历 结束 。 最 后 为 针 


对 长 期 统计 攻击 ， 本 文 还 使 ) 


j 更 换 假 名 的 方式 ， 将 两 种 方式 


结合 在 一 起 ， 从 而 保证 用 


户 得 真实 位 


不 受 侵害 。 


2 GAGP 算法 

本 文 算法 旨 在 保护 用 户 的 
史 查 询 频率 的 情况 下 ， 仍 能 使 
与 其 他 匿名 空间 的 查询 频率 相 


保护 方法 需 使 用 第 三 方 作为 代 j 
里 可 以 根据 历史 查询 数据 计算 出 每 个 网 格 提 交 查 
的 方法 算出 权 值 。 然 后 根据 水 
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询 的 概率 ， 使 用 基于 遗传 算法 


尽 置 隐私 ， 使 在 攻击 者 掌握 历 


户 查询 位 置 所 处 的 匿名 空间 
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。 基 于 该 思想 ， 本 文 的 隐私 
里 ， 首 先 用 户 对 空间 网 格 进 行 


平 扩展 方法 来 扩 


张 网 格 区 域 以 保证 每 个 匿名 区 域 的 查询 概率 


基本 相同 。 最 后 还 采用 了 多 假名 的 方法 以 应 对 LBS 服务 器 长 


攻击 者 的 目标 是 想 要 获取 用 户 的 隐私 信息 ， 其 中 包括 了 统计 攻击 本 处 理 过 程 可 参照 图 3 所 示 。 
地 图 扩张 方法 假名 
iie 7 1 3 a 1 位置， 
Ui 用 户 预 划分 | poi MEER DIO] juin 
posce | SET 扩展 至 权 |i! 1 ^ 58 
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2.1 网 格 预 划分 


用 户 在 第 三 方程 序 上 注册 登录 并 授予 权限 


图 3 GAGP 算法 方案 图 
Fig.3 GAGP algorithm scheme diagram 


理 可 以 获取 整个 地 区 的 历史 数据 的 情况 。 用 户 根据 自己 隐私 


保护 的 需求 ， 设 置 自己 的 网 格 划分 程度 。 这 里 设置 为 n, 


用 户 设置 n 后 , 将 整个 区 域 分 成 n Xm 


uz 


历史 查询 数据 计算 出 每 个 网 格 提交 查询 的 概率 ,如 图 4 所 示 。 
区 ， 颜 色 越 浅说 明 该 区 


其 中 颜色 较 深 的 为 查询 频率 较 高 的 地 


的 网 格 , 代理 可 以 根 


且 假 设 代 


域 查 询 频率 越 低 


2.2 网 格 的 扩张 方法 


本 文 提出 的 匿名 算法 首先 采用 遗传 算法 对 用 


户 划分 的 n 


Xn 网 格 进行 赋 权 值 ， 累 加 权 值 求 和 


值 为 闵 值 ,采用 


水 平 空 间 扩展 的 方法 。 从 第 


4 求 平均 值 ， 以 此 平均 
个 单元 格 开始 ， 


向 水 平方 向 临近 单元 格 扩展 ,判断 累加 的 权 值 是 否 等 于 阔 值 ， 


若 相 等 则 返回 该 网 格 区 域 ， 若 不 等 则 继续 扩展 。 该 方法 采用 
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输入 :各 个 单元 格 ais 的 权 值 wij 以 及 平均 值 avg, 权 值 累 加 和 sum=6。 


输出 : 被 组 合成 同一 匿名 区 域 的 单 


1  for(i-0; i«n; i++) 


2 for(j20; j«n; j=+) 
3 if(sum«avg) 

4 sum-sum-avg; 
并 将 当 
5 end if 
6 比较 现在 这 个 sum 值 和 上 一 
哪个 更 小 ; 
7 if 当前 sum 值 更 合 
8 else 就 返回 上 一 


前 ai; 存 到 集合 n 中 ; 


合 就 把 当 


9 return n; 


元 格 的 集合 。 


个 sum 值 与 avg 的 差 的 绝对 值 


前 的 aij 也 存 到 n 中 ,保存 集合 n; 
个 aij， 保 存 集合 n 


网 格 匿名 空 
划分 网 格 算法 ， 
有 形成 匿名 区 域 小 、 


则 的 划分 的 典型 方法 有 四 分 网 格 法 及 
四 分 网 格 算法 与 四 又 树 划分 网 格 的 方法 相 比 
精度 高 的 优点 。 而 本 文 算法 是 先 计 算 网 


] 又 树 


格 的 查询 频率 并 赋 权 值 ， 根 据 权 值 来 向 周围 网 格 进行 扩展 ， 
与 四 分 网 格 算法 相 比 , 粒 度 和 产生 的 匿名 空间 都 要 更 小 一 些 。 
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法 确认 真实 用 户 的 隐私 信息 。 


通过 假名 来 针 
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Fig. 4 
2.3 算法 的 优化 
于 地 形 和 居住 地 点 布局 的 不 同 ， 
服务 的 概率 也 各 不 相同 ， 比 如 用 
些 地 区 申请 LBS 
方法 由 于 边 信息 
扩张 算法 来 说 ， 
日 一 旦 存在 长 期 统计 攻击 ， 


图 4 网 格 预 划分 结果 


户 一 般 不 会 在 
服务 。 因 此 ， 选 择 k1 个 虚拟 
就 不 能 有 效 地 保护 真实 位 置 。 针 对 


攻击 者 仍 可 以 
。 因 此 ,本 文采 取 多 假名 的 方式 来 应 对 这 种 类 型 的 攻击 。 
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